AI032
マッスィブに並列処理を行うプログラミング:実践的アプローチ
高度なCUDAスレッド処理とスケジューリング
学習目標
- Streaming Multiprocessor間におけるグローバルブロックの配布におけるGigaThreadエンジンの役割を分析する。
- ワープスケジューリングおよび命令ディスパッチがパイプライン利用率に与える影響を評価する。
- レジスタ圧力と共有メモリのバランスを確保しつつ、オキュパンシーとの関係でカーネルのパフォーマンスを最適化する。
- 高度な同期プリミティブおよび協調グループ実行パターンを習得する。